Semillero de R - FacCA

Mundo R + tidyverse II

Estadística Descriptiva con R

Función Descripción
mean() Media
median() Mediana
sd() Desviación estándar
var() Varianza
range() Rango
min() Valor mínimo
max() Valor máximo
quantile() Cuartiles, deciles y percentiles
cor() Coeficiente de correlación
IQR() Rango intercuartílico
skewness() Coeficiente de asimetría (biblioteca moments)
kurtosis() Coeficiente de curtosis (biblioteca moments)

Función Descripción
table() Tabla de frecuencias absolutas
prop.table() Tabla de frecuencias relativas
sort() Ordenar los datos
sum()() Sumar
colSums() Suma por columnas
rowSums() Suma por filas
colMeans() Promedios por columnas
rowMeans() Promedios por filas

Datos ordenados (tidy data)

“Tidy datasets are all alike but every messy dataset is messy in its own way.”

– Hadley Wickham

¿Qué son datos ordenados?

  1. Cada variable debe tener su propia columna.
  2. Cada observacioón debe tener su propia fila.
  3. Cada valor debe tener su propia celda.

¿Qué son datos ordenados?



Funciones tidyr

  • spread(): de formato largo a formato ancho.
  • gather(): de formato ancho a formato largo.
  • separate(): separar columnas.
  • unite(): unir columnas.

Usos de las funciones tidyr

  • spread(data, key, value)
  • gather(data, "variable1", "variable2", 1:3)
  • separate(data, Separ, into = c("n1", "n2"), sep = "/")
  • unite(data, "nueva", var1, var2, sep = "")

spread()



gather()



Ejemplos

Resultados Saber 11º